import pandas as pd

# 读取Excel文件（请将文件路径替换为您的实际文件路径）
file_path = 'E:/02_item/04_期末考试/01_模拟考试+编排+预约考试/原始数据.xlsx'  # 修改为您的文件路径
df = pd.read_excel(file_path)

# 计算每个学号对应的试卷号数量
result = df.groupby('考生学号*')['试卷号*'].count().reset_index()
result.columns = ['考生学号', '试卷号数量']

# 按试卷号数量降序排列
result = result.sort_values('试卷号数量', ascending=False)

# 显示结果
print("每个学号对应的试卷号数量统计:")
print(result)

# 显示统计摘要
print(f"\n统计摘要:")
print(f"总学号数量: {len(result)}")
print(f"平均每个学号的试卷号数量: {result['试卷号数量'].mean():.2f}")
print(f"最大试卷号数量: {result['试卷号数量'].max()}")
print(f"最小试卷号数量: {result['试卷号数量'].min()}")

# 保存结果到新Excel文件
output_file = 'E:/02_item/04_期末考试/01_模拟考试+编排+预约考试/学号试卷号统计结果.xlsx'
result.to_excel(output_file, index=False)
print(f"\n结果已保存到: {output_file}")